【文献解读】SciRep:ONT MinION和Illumina Miseq对室内尘埃微生物组16S rRNA测序的区别
简介
标题:SciRep:Nanopore MinION和Illumina Miseq对室内尘埃微生物组16S rRNA测序的区别
杂志:Scientific reports
影响因子:3.998
发表时间:2020年2月21日
解读:很跩的土豆
编辑:很跩的土豆
导读:Oxford Nanopore Technology(ONT)测序技术的发展,其可移动性、对用户友好、简单、测序速度快和长读长等特点使得这项技术具有极强的可推广性,是现有的测序平台的有力竞争者。ONT测序设备虽在不但完善和发展,但相较二代测序平台,其缺点就是测序准确率低。为了对比ONT测序设备(MinION)和二代测序设备(Illumina MiSeq)的测序结果,作者使用两种测序设备对室内尘埃微生物组进行了测序分析,发现在科及以上分类水平,MinION和MiSeq的测序结果无显著差异;然而,在属和种水平(尤其是种水平),MinION较MiSeq获得了更多的物种分类信息。
缺点:样本量小、样本类型少。
正文
1. 16S rRNA的序列量
Illumina 300-bp双端测序共获得2203794条reads,183650条/样本;质控后582032条,48503 ASVs/样本用于后续分析。MinION basecalling后获得2408076条reads,200673 reads/样本;质控后1156807条reads,96401 reads/样本(表1)。
Table 1. Sequence reads generated per sample for both short-read and long-read amplicons.
2. 16S rRNA分类
使用Greengenes(GG)和SILVA数据库对测序数据进行注释。对于短序列,SILVA在各分类水平上,都能注释更多的序列。而对于长序列,GG和SILVA的注释结果差异较大。GG对高水平,尤其是目(Order)水平注释较好;而SILVA对中水平注释较好(表2)。
Table 2. Taxonomic assignment of short-read (Illumina Miseq) and long-read (Nanopore MinION) amplicons against the Greengenes (GG) and SILVA 16S rRNA gene reference databases.
3. 分类效率
使用GG,长、短序列共注释732个细菌种,其中,91.7%由MinION测序产生。使用SILVA,共注释10745个细菌种,其中99.5%由MinION测序产生(表3)。
4. 基于MinION和MiSeq测序结果的尘埃微生物组成特点
使用GG和SILVA对长、短序列测序结果进行注释,分析丰度最高的15个细菌属和种的特点。种水平,很少有细菌种是有长短序列同时注释的,SILVA注释的细菌种最多,且大多来自长序列(Fig 1,2,3,4)。
Figure 1. Heatmap of the 15 most abundant genera identified by mapping 16S rRNA gene amplicons sequenced on Illumina MiSeq and Nanopore MinION against the Greengenes reference database.
Figure 2. Heatmap of the 15 most abundant genera identified by mapping 16S rRNA gene amplicons sequenced on Illumina MiSeq and Nanopore MinION against the SILVA reference database.
Figure 3. Heatmap of the 15 most abundant species identified by mapping 16S rRNA gene amplicons sequenced on Illumina MiSeq and Nanopore MinION against the Greengenes reference database.
Figure 4. Heatmap of the 15 most abundant species identified by mapping 16S rRNA gene amplicons sequenced on Illumina MiSeq and Nanopore MinION against the SILVA reference database.
测序结果同时再次使用NCBI数据库进行注释。NCBI的注释结果与GG相似。
Table 4. The most abundant taxa at the genus level identified from the three different sample types using Illumina short-read sequences and Nanopore long-read sequences and three different databases. aNot assigned taxonomies.
5. 长短序列矫正
Spearman相关性分析发现在科水平长短序列的注释结果相似,而在属和种水平差异较大。此外,MinION和MiSeq测序结果中,丰度小于0.01%的细菌属、种都较多。
Figure 5. Correlation of identified taxa at (a) the genus level against GG, (b) genus level against SILVA, (c) species level against GG, and (d) species level against SILVA between sequencing platforms for all 12 samples. The dashed lines mark a 0.01% relative abundance threshold for each taxa for Nanopore and Illumina sequence data.
总结:
MinION用于16S rRNA测序分析较有前景,其长序列使得种水平的注释得到改善。
索引
往期文献:【文献解读】Microbime:微生物组学领域的标准制定
【文献解读】新冠病毒病毒活性与COVID-19患者肠道菌群的关系
参考
[1] Scientific RepoRtS (2020) 10:3209.DOI: 10.1038/s41598-020-59771-0.
后记
随着测序技术的不断发展,科学研究进入了数据井喷的时代。然而,测序样本的处理流程、测序数据的分析流程甚至是数据分析过程中的数据库搭建问题,都给测序技术的普及化设置了壁垒,严重阻碍了该项技术向广大科研工作者中推广。此外,基于长读长的三代测序技术的发展更是引入了一套完全有别于二代测序数据处理的分析流程,为了让更多学者认识三代测序、在科学研究中用好三代测序,本公众号应运而生。期待与您一起学习、成长。
^_^ 边学习,边分享,每天进步一点点 ^_^